home *** CD-ROM | disk | FTP | other *** search
/ MacWorld 1999 August / Macworld (1999-08).dmg / From Macworld Readers / FREE Scripts / FREE Guides / FREE Guide Macintosh / FREE Guide • Macintosh 3.1.sea / FREE Guide • Macintosh 3.1.rsrc / TEXT_139.txt < prev    next >
Text File  |  1998-12-04  |  13KB  |  356 lines

  1.  
  2.  
  3.  
  4.  
  5. SPEECH
  6.  
  7.  
  8.  
  9. ¬†              Most Macs can synthesise speech if the necessary system software is installed.
  10.                A PowerMac with extra software can even respond to your spoken commands!
  11.  
  12.  
  13.  
  14. Synthesised Speech
  15. qqqqqqqqqqqqqqq
  16.  
  17. Synthesised speech on the Mac is called text-to-speech (TTS). Any text, such as that in a document or dialog can be converted into speech using a software synthesiser. To use TTS you‚Äôll need a application to works with it ‚Äî if you can‚Äôt find anything else try SimpleText!
  18.  
  19.  
  20.  
  21. System Software for Speech Synthesis
  22. wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
  23.  
  24. TTS needs special software in your System Folder. The Easy Install option in the System Installer provides it automatically ‚Äî if not, you‚Äôll have to use Custom Install. The Mac Plus doesn‚Äôt support TTS and the presence of its software can cause a freeze during startup
  25. ‚Äî hold down Space during startup to disable it with Extensions Manager.
  26.  
  27. To use TTS the following files must be in the System Folder:-
  28.  
  29.                √∏  In the Extensions folder:
  30.                        Speech Manager
  31.                        MacinTalk 2 and/or Macintalk 3 and/or MacIntalk Pro synthesiser
  32.                        Voices folder with voices matching the version of Macintalk
  33.  
  34.                √¶  In the Control Panels folder:
  35.                        Speech control panel
  36.  
  37.  
  38. Speech Synthesisers                                                                                                
  39.  
  40. The MacinTalk 2 and 3 speech synthesisers are included in the system software but the Macintalk Pro synthesiser is a separate product.
  41.  
  42. MacinTalk 2 is suitable for any Mac with a 68000, 68020 or 68030 processor running at under 33 MHz. Even if you use Macintalk 3 you‚Äôll still need MacinTalk 2 for MacinTalk 2 voices! These voices, such as Boris and RoboVox, only use a small amount of RAM. Macintalk 3 is an improved version for 68030 Macs running at 33 MHz or more.
  43.  
  44. MacIntalk Pro is for 68040 Macs or PowerMacs only. It‚Äôs voices can use up to 5 M of RAM each. Since they‚Äôre mainly contained in system memory you shouldn‚Äôt need to keep adjusting the memory assigned to a speech application ‚Äî but the memory must still be available! Compressed voices require much less memory. The Gala Tea voices supplied with PlainTalk (see below) include TTS Male, Agnes, Bruce and Victoria ‚Äî their RAM requirements are similar to the MacinTalk Pro voices.
  45.  
  46. √ö The varied upper-case letters in these file names aren‚Äôt a mistake!
  47.  
  48.  
  49. The Voices Folder                                                                                                   
  50.  
  51. The voice files the Voices folder can only be used by the appropriate Macintalk synthesiser. All available voices appear in the Speech control panel and speech application menus.
  52.  
  53. √ö A voice file will only work if its matching synthesiser is available. The voice file 
  54.        type is shown by the number on its icon.
  55.  
  56.  
  57. The Speech Control Panel                                                                                         
  58.  
  59.  
  60. ¬†              This panel is used to set the defaults for speech synthesis and recognition. You 
  61.                can choose a default Macintalk voice and specify its rate of delivery.  Just click on 
  62.                the loudspeaker box for a sample!
  63.  
  64.  
  65.  
  66.  
  67.  
  68.  
  69.  
  70.  
  71.  
  72.  
  73.  
  74.  
  75.  
  76.  
  77.  
  78.  
  79.  
  80.  
  81.  
  82.  
  83. Speech Synthesis in Applications
  84. wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
  85.  
  86. With the appropriate system software installed you can use TTS in any application that supports it. For example, SimpleText will read out the contents of a file ‚Äî you can choose a voice from the Sound menu.
  87.  
  88.  
  89.  
  90.  
  91.  
  92.  
  93.  
  94.  
  95.  
  96.  
  97.  
  98.  
  99.  
  100.  
  101.  
  102. ¬†              So To Speak is an application that demonstrates TTS to the full. The voices are 
  103.                selected using a pop-up menu and during speech the pitch and rate of delivery 
  104.                can be adjusted ‚Äî the speech can be paused and stopped at any point.
  105.  
  106. Both So To Speak and Speaker (a neat application for reading text files) can use an external file containing a pronunciation dictionary (see below).
  107.  
  108.  
  109. Voice Parameters                                                                                                   
  110.  
  111. Some applications let you modify the parameters of a voice. Here‚Äôs the dialog for an application called DictionaryEdit (see below):-
  112.  
  113.  
  114.  
  115.  
  116.  
  117.  
  118.  
  119.  
  120.  
  121.  
  122.  
  123.  
  124.  
  125.  
  126.  
  127.  
  128.  
  129.  
  130.  
  131.  
  132.  
  133.  
  134.  
  135.  
  136.  
  137.  
  138. The parameters are:-
  139.  
  140.                Rate                  Speed of delivery, as in the Speech control panel
  141.                Pitch                 Underlying tone of voice ‚Äî higher for females!
  142.                Modulation          Inflection, emphasising parts of words or sentences
  143.  
  144.  
  145.  
  146. Speech Synthesis in System Additions
  147. wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
  148.  
  149. ¬†                Special control panels or extensions can be used to add extra TTS features to your 
  150.                  Mac. For example, Speak2Me will read out the name of a selected icon in the 
  151.                  Finder whilst SpeakAlert will speak the contents of any alert box.
  152.  
  153.  
  154.  
  155. Pronunciation Dictionaries
  156. wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
  157.  
  158. ¬†              TTS often pronounces words incorrectly ‚Äî especially the names of people 
  159.                and places. A pronunciation or speech dictionary can be used to tell a synthesiser 
  160.                how to pronounce these words.
  161.  
  162. The dictionary describes the pronunciation of each word with phonemes and prosodic controls ‚Äî each represented by a sequence of characters. Phonemes describe the sound of each syllable whilst prosodic controls add the stress and intonation for natural speech.
  163.  
  164. If a speech application finds a word in its dictionary, the synthesiser uses the dictionary‚Äôs entry instead of the standard conversion rules. A dictionary can substitute the word by an alternative spoken word ‚Äî but it‚Äôs more often used to optimise the pronunciation.
  165.  
  166. The dictionary comes in the form of a dict resource that‚Äôs loaded by the speech application prior to use. This resource can be in the application itself or in a file of Type dict or rsrc.
  167.  
  168. Most dictionaries don‚Äôt support abbreviated entries and only allow two fields per entry ‚Äî the first is the text , the second is the phoneme. Both entries mustn‚Äôt contain more than 256 characters. The list inside a dictionary isn‚Äôt always sorted into any particular order!
  169.  
  170.  
  171. Inside a Pronunciation Dictionary                                                                               
  172.  
  173.  
  174. ¬†              DictionaryEdit is an application for modifying dicts. Several dictionaries can be 
  175.                open at once, but you can only edit one dict at a time within a single file. 
  176.  
  177.  
  178. You can cut and copy (or drag) entries between dictionaries or fill a dictionary by converting its text into phonemes.
  179.  
  180. When you select Open Dictionary‚Ķ you‚Äôre presented with this window:-
  181.  
  182.  
  183.  
  184.  
  185.  
  186.  
  187.  
  188.  
  189.  
  190.  
  191.  
  192.  
  193.  
  194.  
  195.  
  196.  
  197.  
  198.  
  199.  
  200.  
  201.  
  202.  
  203.  
  204.  
  205.  
  206.  
  207.  
  208.  
  209. The left-hand box contains each text entry in the dictionary. The lower box to the right contains a list of the phonemes and prosodic controls that make up the word samuel.
  210.  
  211. When you click on the left-hand icon the selected text is automatically converted into its component parts and placed in the phoneme list. You can then edit the phonemes or add prosodic controls as necessary.
  212.  
  213. As you work you can listen to the results by clicking on the right-hand icon. You can also open and edit text files for to try out your new dictionaries.
  214.  
  215.  
  216. Phonemes                                                                                                              
  217.  
  218. Phonemes are components of speech that are represented by case sensitive symbols.  For example, the vowel in the words bout and how are both represented by the AW phoneme ‚Äî even though they‚Äôre spelt differently!
  219.  
  220. The full list of phonemes is:-
  221.  
  222.                AE        bat          EY        bait         AO        caught         AX        about
  223.                IY        meet         EH  bet          IH        bit            AY        bite
  224.                IX        closes       AA  cot          UW     boot           UH        book
  225.                UX        mud          OW     boat         AW     bout           OY        boy
  226.                b         bin          C         chin         d         dark           D         those
  227.                f         fake         g         gain         h         hat            J         gin
  228.                k         kin          l         limb         m         mat            n         knock
  229.                N         tang         p         pin          r         ran            s         satin
  230.                S         shin         t         tin          T         thin           v         van
  231.                w         wet          y         yank         z         zen            Z         genre
  232.  
  233.                %        silence       @        breath intake
  234.  
  235. For example, the word application is AEplIHkEYSAXn.
  236.  
  237.  
  238. Prosodic Codes                                                                                                      
  239.  
  240. Prosodic codes (or prosody symbols) are used with phonemes to fine tune the pronunciation.
  241.  
  242. They include:-
  243.  
  244.                Symbol      Meaning
  245.  
  246.                  1         Primary Stress
  247.                  2         Secondary Stress
  248.                  =         Syllable Mark
  249.                  ~         Unstressed
  250.                  _         Normal Stress
  251.                  +         Emphatic Stress
  252.                  /         Pitch Rise
  253.                  \         Pitch Fall
  254.                  >         Lengthen phoneme
  255.                  <         Shorten phoneme
  256.                  .         Sentence final fall
  257.                  ?         Sentence final rise
  258.                  !         Sentence final sharp fall
  259.                  ‚Ķ         Clause final level
  260.                  ,         Continuation rise
  261.                  ;         Continuation rise
  262.                  :         Clause final level
  263.                  (         Start reduced range
  264.                  )         End reduced range
  265.                  ‚Äú         Varies
  266.                  ‚Äò         Varies
  267.                  ‚Äù         Varies
  268.                  ‚Äô         Varies
  269.                  -         Clause final level
  270.                  &         Forces no silence between phonemes
  271.  
  272.  
  273. The stress codes    (1 and 2) indicate which syllables should be emphasised.
  274. For example, the word anticipation could be in the form:-
  275.  
  276.                AEnt2IHsIXp1EYSAXn
  277.  
  278. The syllable codes (=)    break the word into syllables:-
  279.  
  280.                AEn=t2IH=sIX=p1EY=SAXn
  281.  
  282. The word prominence codes (~, _ and +) indicates the need to stress a particular word. The true prosodic codes (/, \, > and <) can be used to modify a phoneme to make a word sound more natural.
  283.  
  284.  
  285. The Dictionary Header                                                                                            
  286.  
  287. Some applications let you edit the dictionary‚Äôs header ‚Äî most users won‚Äôt need to modify it. In DictionaryEdit you‚Äôre presented with this window:-
  288.  
  289.  
  290.  
  291.  
  292.  
  293.  
  294.  
  295.  
  296.  
  297.  
  298.  
  299.  
  300.  
  301.  
  302.  
  303.  
  304.  
  305.  
  306.  
  307.  
  308.  
  309.  
  310. The parameters are:-
  311.  
  312.                Parameter                    Usual contents                                                                   
  313.  
  314.                Atom type                         This is dict for a standard dictionary
  315.                Format version                  This is 1 for a pronunciation dictionary
  316.                Script                                   For the Roman system this is 0
  317.                Language                            Code for English is 0
  318.                Region                                 Code for the USA is is 0; for the UK it‚Äôs 2
  319.                Date Last Modified           Last date the dictionary was modified.
  320.                Dict size                               Total byte length of the dictionary
  321.  
  322. The size indicates how much memory the dictionary will use when loaded.
  323.  
  324.  
  325.  
  326.  
  327. Speech Recognition
  328. qqqqqqqqqqqqqqq
  329.  
  330.  
  331. The PlainTalk software package lets you speak instructions to your Mac ‚Äî but only if it‚Äôs an AV Mac or PowerMac. If you install MacIntalk Pro as well it will reply in good voice!
  332.  
  333. √ö For full details see the information supplied with the PlainTalk package.
  334.  
  335. To use speech recognition you‚Äôll need a PlainTalk microphone. The circular microphone supplied with many Macs isn‚Äôt suitable ‚Äî but the one built into an AV monitor is! Many Macs can‚Äôt accept a PlainTalk microphone!
  336.  
  337. √π  See the Sound chapter for more about microphones and sound inputs.
  338.  
  339. ¬†              You‚Äôll also need the Speakable Items software, the Speech control panel and the 
  340.                Speech Recognition extension. You should also install the software for TTS!
  341.  
  342.  
  343. Other necessary extension files include:
  344.  
  345.                Extension                                 Function                                                          
  346.  
  347.                Speech Macro Editor              Defines Mac instructions
  348.                My Speech Macros                  Contains your instructions
  349.                SR Monitor                               Monitors and interprets speech
  350.                System Speech Rules                For different voices and speech dialects
  351.  
  352. With recognition enabled, a list of spoken commands appear in the Speakable Items folder in the Ô£ø menu. The Listening option in the Speech control panel lets you pick a key combination to switch the Mac into listening mode ‚Äî it then accepts commands.
  353.  
  354.  
  355.  
  356. ¬©Ray White. All Rights Reserved 1997